Towards Better Domain Adaptation for Self-Supervised Models: A Case Study of Child ASR
نویسندگان
چکیده
Recently, self-supervised learning (SSL) from unlabelled speech data has gained increased attention in the automatic recognition (ASR) community. Typical SSL methods include autoregressive predictive coding (APC), Wav2vec2.0, and hidden unit BERT (HuBERT). However, models are biased to pretraining data. When finetuned with another domain, domain shifting occurs might cause limited knowledge transfer for downstream tasks. In this paper, we propose a novel framework, responsible adaptation finetuning (DRAFT), reduce pretrained models, evaluate it causal non-causal transformer. For transformer, an extension of APC (E-APC) is proposed learn richer information by using multiple temporally-shifted sequences perform prediction. various solutions bidirectional (Bi-APC) investigated. addition, DRAFT framework examined Wav2vec2.0 HuBERT methods, which use transformers as backbone. The experiments conducted on child ASR (using OGI MyST databases) trained adult Librispeech. relative WER improvements up 19.7% two tasks observed when compared without adaptation. With (E-APC DRAFT), even larger (30% 19% data, respectively) methods.
منابع مشابه
the application of multivariate probit models for conditional claim-types (the case study of iranian car insurance industry)
هدف اصلی نرخ گذاری بیمه ای تعیین نرخ عادلانه و منطقی از دیدگاه بیمه گر و بیمه گذار است. تعین نرخ یکی از مهم ترین مسایلی است که شرکتهای بیمه با آن روبرو هستند، زیرا تعیین نرخ اصلی ترین عامل در رقابت بین شرکتها است. برای تعیین حق بیمه ابتدا می باید مقدار مورد انتظار ادعای خسارت برای هر قرارداد بیمه را برآورد کرد. روش عمومی مدل سازی خسارتهای عملیاتی در نظر گرفتن تواتر و شدت خسارتها می باشد. اگر شر...
15 صفحه اولa study on thermodynamic models for simulation of 1,3 butadiene purification columns
attempts have been made to study the thermodynamic behavior of 1,3 butadiene purification columns with the aim of retrofitting those columns to more energy efficient separation schemes. 1,3 butadiene is purified in two columns in series through being separated from methyl acetylene and 1,2 butadiene in the first and second column respectively. comparisons have been made among different therm...
a study on construction of iranian life tables: the case study of modified brass logit system
چکیده ندارد.
15 صفحه اولesp needs analysis of iranian ma students: a case study of university of isfahan
نیاز سنجی دانشجویان کارشناسی ارشد ایرانی در رابطه با زبان تخصصی: مطالعه ای در دانشگاه اصفهان هدف از این مطالعه بررسی نیازهای یادگیری زبان خارجی دانشجویان کارشناسی ارشد دانشجویان دانشگاه اصفهان در رشته های زیست شناسی، روانشناسی، تربیت بدنی، حسابداری و فلسفه ی غرب میباشد. در مجموع 80 دانشجودر پنج رشته ی متفاوت از دانشگاه اصفهان در این پژوهش شرکت داشتند.علاوه بر این هشتاد دانشجو،25 استاد دروس ت...
15 صفحه اولthe effect of consciousness raising (c-r) on the reduction of translational errors: a case study
در دوره های آموزش ترجمه استادان بیشتر سعی دارند دانشجویان را با انواع متون آشنا سازند، درحالی که کمتر به خطاهای مکرر آنان در متن ترجمه شده می پردازند. اهمیت تحقیق حاضر مبنی بر ارتکاب مکرر خطاهای ترجمانی حتی بعد از گذراندن دوره های تخصصی ترجمه از سوی دانشجویان است. هدف از آن تاکید بر خطاهای رایج میان دانشجویان مترجمی و کاهش این خطاها با افزایش آگاهی و هوشیاری دانشجویان از بروز آنها است.از آنجا ک...
15 صفحه اولذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: IEEE Journal of Selected Topics in Signal Processing
سال: 2022
ISSN: ['1941-0484', '1932-4553']
DOI: https://doi.org/10.1109/jstsp.2022.3200910